Recherche d'information textuelle et phonétique pour le contrôle de l'étiquetage automatique d'émissions dans un flux télévisuel
نویسنده
چکیده
In 2007, Naturel (Naturel, 2007) developed a method which, given a segmented video stream, associated a label with each segment. However, this method did not automatically check the accuracy of the results obtained. In this paper we propose to control these results, by taking each segment, and associating the corresponding phonetic or textual transcription of the soundtrack with descriptions extracted from a TV guide. Using techniques inspired from information retrieval methods, a description is linked to each segment, which can then be compared with the label associated by Naturel’s method. This new method allows us to make a decision for 45% of the segments, and to lower the original labeling error rate by 3.5%. MOTS-CLÉS : transcription automatique de la parole, recherche d’information textuelle, recherche d’information phonétique, multimédia, étiquetage des segments de flux TV
منابع مشابه
Éléments pour adapter les systèmes de recherche d'information aux dyslexiques
RÉSUMÉ. La prise en compte des troubles de la communication dans l’utilisation des systèmes de recherche d’information tels qu’on peut en trouver sur le Web est généralement réalisée par des interfaces utilisant des modalités n’impliquant pas la lecture et l’écriture. Peu d’applications existent pour aider l’utilisateur en difficulté dans la modalité textuelle. Nous proposons la prise en compte...
متن کاملOutils de fouille textuelle à partir d'annotations sémantiques
L’exploitation automatique d’annotations sémantiques, effectuée selon des ontologies linguistiques contenant des points de vue tels qu’hypothèse, citation, méthode, résultat, ... permet de mettre en place de nouveaux produits documentaires, que nous appellerons fiches de synthèse ou bibliographie augmentée, offrant à l’utilisateur un aperçu structuré et synthétisé des contenus textuels correspo...
متن کاملUn modèle de rôles multi-politiques d'accès pour la coopération en sécurité de systèmes d'information
RÉSUMÉ. Ce travail de recherche s'inscrit dans le domaine de la sécurité des accès dans les systèmes d'information coopérant. La modélisation proposée doit prendre en compte l'interopération de systèmes d'information ouverts et évolutifs et, de plus, garantir le respect des différentes politiques de sécurité locales. La coexistence de sources d’information hétérogènes dans le cadre d’un système...
متن کاملUne extension de XQuery pour la recherche textuelle d'information dans des documents XML
Résumé. Nous présentons dans cet article une extension de XQuery que nous avons développée pour interroger le contenu et la structure de documents XML. Cette extension consiste à intégrer dans XQuery le langage NEXI, un sous-ensemble de XPath, défini dans le cadre de l’initiative INEX. Notre proposition est double : (i) équiper NEXI d’une sémantique floue, (ii) intégrer NEXI dans XQuery au moye...
متن کاملAccès aux connaissances orales par le résumé automatique
Le temps nécessaire pour écouter un flux audio est un facteur réduisant l’accès efficace à de grandes archives de parole. Une première approche, la structuration automatique des données, permet d’utiliser un moteur de recherche pour cibler plus rapidement l’information. Les listes de résultats générées sont longues dans un souci d’exhaustivité. Alors que pour des documents textuels, un coup d’o...
متن کامل